Chi phí AI giảm 280 lần, nhưng các sự cố có hại tăng 56% trong năm ngoái-Báo cáo AI của Stanford 2025
Theo Báo cáo Chỉ số AI 2025 của Stanford, chi phí để sử dụng các mô hình AI cao cấp đã giảm mạnh từ 20 USD xuống còn 0,07 USD cho mỗi triệu token chỉ trong 18 tháng. Báo cáo này cũng chỉ ra nhu cầu cấp thiết về các quy định AI có trách nhiệm và sự cạnh tranh ngày càng tăng giữa Mỹ và Trung Quốc trong lĩnh vực công nghệ AI. Viện AI lấy con người làm trung tâm của Đại học Stanford đã phát hành báo cáo Chỉ số AI hàng năm từ năm 2017 và các báo cáo gần đây thường được trích dẫn bởi các chính phủ trên thế giới.
HAI đã thu thập và tổng hợp dữ liệu về nhiều khía cạnh của trí tuệ nhân tạo, nghiên cứu đầu tư vào thị trường, cách thức và nơi công nghệ được sử dụng nhiều nhất cũng như những điểm thiếu hụt. Báo cáo năm nay đưa ra những cái nhìn sâu sắc về sự phát triển của AI trong năm 2024 và dự đoán hướng đi tiếp theo. Chi phí cho AI đã giảm... nhưng chi phí đào tạo lại tăng.
Sự mâu thuẫn này được minh họa qua các biểu đồ trong nghiên cứu của HAI, cho thấy các công ty lớn đã tăng cường đầu tư vào các mô hình chủ chốt, trong khi chi phí vận hành và truy vấn các mô hình này đã giảm đáng kể. Chi phí truy vấn AI giảm chủ yếu nhờ vào phần cứng tốt hơn, hiệu suất cao hơn và hiệu quả năng lượng.
Vào ngày 8 tháng 4 năm 2025, OpenAI, Meta và Google đã tăng đáng kể chi phí đầu tư vào các mô hình ngôn ngữ chủ lực của họ. Trung bình, mỗi công ty chi gấp 28 lần so với mô hình trước đó để đào tạo mô hình AI mới nhất. Sự gia tăng từ 3 triệu lên 170 triệu của Meta là lớn nhất. Các công ty mới nổi như Mistral và xAI cũng tham gia với khoản chi cao - Grok-2 ước tính tốn 107 triệu để đào tạo.
Chi phí để đào tạo các LLM này dường như không giảm trong thời gian tới. xAI Grok-3, ra mắt công chúng vào tháng 2, được cho là đã sử dụng gấp 10 lần GPU so với Grok-2. Grok-3 không công bố giá chính thức, nhưng có thể đã tiêu tốn hơn 1 tỷ đô la. Những con số này thật khổng lồ, và trong khi các công ty trị giá hàng nghìn tỷ đầu tư hàng trăm tỷ vào thế hệ AI tiếp theo, chi phí để đạt được GPT-3 vẫn rất cao.
Hiệu suất của mô hình đã giảm. Chi phí để inference một mô hình đạt hiệu suất tương đương GPT-3.5 (được HAI định nghĩa là 64.8% độ chính xác) đã giảm 280 lần từ tháng 11 năm 2022 đến tháng 10 năm 2024. Sự giảm giá này chủ yếu do chi phí phần cứng và vận hành của các mô hình AI nhỏ hơn. Chi phí phần cứng AI doanh nghiệp đã giảm 30% trong năm qua, với phần cứng mới cũng tiết kiệm năng lượng hơn 40%. Các công ty có thể sẽ tiếp tục chi tiêu nhiều hơn cho việc đào tạo các mô hình chủ lực mỗi năm, nhưng người dùng bình thường có thể hài lòng với GPT-3.
Chi phí của 5 sản phẩm hoạt động sẽ ngày càng giảm. Trung Quốc đang bắt kịp sự thống trị của Mỹ trong lĩnh vực trí tuệ nhân tạo. Mỹ đã là nước chi tiêu nhiều nhất và có hiệu suất hàng đầu trong AI từ khi công nghệ này trở nên phổ biến. Tuy nhiên, Trung Quốc đang tiến gần hơn trong cuộc đua AI. Các mô hình ngôn ngữ lớn (LLM) hàng đầu của Mỹ và Trung Quốc đang trở nên tương đương về hiệu suất khi được thử nghiệm trong các tiêu chuẩn ngành.
Trước đây, Mỹ không chỉ có nhiều mẫu mã nhất mà còn có hiệu suất tốt nhất. Tuy nhiên, năm nay, Trung Quốc đã thu hẹp khoảng cách đó. Vào tháng 1 năm 2024, mẫu tốt nhất của Mỹ vượt trội hơn mẫu tốt nhất của Trung Quốc 9,26%, nhưng đến tháng 2 năm 2025, tỷ lệ này chỉ còn 1,70%. Như biểu đồ trên cho thấy, mẫu tốt nhất của Mỹ chỉ đánh bại mẫu hàng đầu của Trung Quốc 1,70%, theo kết quả thử nghiệm mù tại LMSYS Chatbot Arena.
Kết quả từ các bài kiểm tra hàng đầu MMLU và HumanEval đã gần đạt được sự cân bằng, với Mỹ vẫn giữ vị trí nhỉnh hơn. Mỹ vượt xa Trung Quốc về số lượng, mặc dù không phải về chất lượng. Trong bộ sưu tập HAI gồm các mô hình AI nổi bật, Mỹ dẫn đầu với 40 trong số 2024 mô hình LLM đáng chú ý nhất, trong khi Trung Quốc chỉ có 15 và toàn bộ châu Âu chỉ đóng góp 3 mô hình.
Chương về AI có trách nhiệm trong báo cáo về các sự cố AI có hại cho thấy thực tế đáng lo ngại về việc sử dụng AI, với mức độ rủi ro không thể bỏ qua. Theo tổ chức nghiên cứu phi lợi nhuận AI Incident Database (AIID), số lượng sự cố AI có hại đã tăng đáng kể vào năm 2024, với 233 sự cố được báo cáo, vượt qua 150 sự cố năm 2023 và 100 năm 2022.
Một số sự cố nghiêm trọng nhất trong năm 2024 đã được liệt kê trong Chương 3 của báo cáo HAI. Các sự cố này bao gồm việc nhận diện sai một người mua sắm bị nghi ngờ là kẻ trộm với AI chống trộm, nội dung khiêu dâm deepfake, và các trường hợp chatbot khuyến khích hành vi gây hại, bao gồm tự hại. Đáng chú ý, ít công ty AI nào nhận trách nhiệm khi xảy ra sự cố, với nhiều vụ việc trên dẫn đến việc các công ty liên quan từ chối xin lỗi hoặc bồi thường.
Các thông tin khác từ chỉ số AI năm 2025 của HAI có thể được tìm thấy trên trang web của Stanford HAI. Nghiên cứu gồm 8 chương, bao quát nhiều khía cạnh hơn so với những gì có thể đề cập ở đây. Cảnh quan AI hiện đang mở rộng và được đầu tư nhiều hơn bao giờ hết, khiến các mức thuế gần đây có thể làm thay đổi hiện trạng trở nên đáng lo ngại cho ngành công nghiệp còn mới mẻ. Tương lai của công nghệ này vẫn còn chưa rõ ràng.
Nguồn: www.tomshardware.com/tech-industry/artificial-intelligence/ai-costs-drop-280-fold-but-harmful-incidents-rise-56-percent-in-last-year-stanford-2025-ai-report-highlights-china-us-competition